Arbeidsfysiologisk metode og Statistikk

Statistisk inferens

Målet med statistisk inferens

Målet med statistisk inferens

  • Vi ønsker å si noe om data vi ikke har observert (en populasjon) basert på data som vi observerer (et utvalg).
  • Populasjon (i statistikken) er alle mulige observasjoner eller verdier som vi (i teorien) kan måle/observere.
  • Et utvalg en liten del av populasjonen som vi valgt eller har mulighet til å studere

Populasjon, utvalg og inferens

  • Vi velger utvalg basert på hvilken populasjon vi ønsker å generalisere til
  • Utvalg som ikke er trukket gjennom en tilfeldig prosess kan påvirke muligheter til generalisering og hvilke konklusjoner som er mulige å trekke
  • Innen idrettsforskning er ulike bekvemmelighetsutvalg trolig vanligere enn tilfeldige utvalg
  • Hvis og hvordan utvalgsprosessen kan ha påvirket muligheter til generalisering må evalueres i hvert studie.

Utvalg og estimering

  • Vi kan estimere egenskaper hos populasjonen basert på utvalget
  • Estimering med et utvalg er en usikker prosess og vi ønsker å vite hvor stor usikkerheten er
  • Vi kan velge å se på usikkerhet som en prosess med repeterte utvalg

Utvalg og estimering

Estimering av et gjennomsnitt

Estimering av et gjennomsnitt

  • Ved hjelp av modell for utvalgsfordelingen kan vi si noe om hvor stor variasjon vi forventer i blant repeterte gjennomsnitt
  • Modellen vi bruker kan tilpasses for å gi en bedre beskrivelse av utvalgsfordelingen, når vi er interesserte kontinuerlig data bruker vi typisk en t-fordelingen eller normalfordeling

Konfidensintervaller

Hypotesetesting

Hypotesetesting

  • En annen metode for å trekke konklusjoner om en populasjon er hypotesetesting
  • Vi stiller opp en hypotese og bruker data for trekke konklusjoner om populasjonen

Hypotesetesting

  • Data gir oss en indikasjon på hva vi kan forvente å observere i populasjonen
  • Vi stiller opp en nullhypotese, \(H_0\), som er en påstand om populasjonen
  • Men hvor ekstrem er observasjonen (dataene) hvis nullhypotesen er sann?

En p-verdi

  • Vi har nå beregnet en p-verdi, sannsynligheten for å få et resultat som det vi observerer, eller et enda mer ekstremt når nullhypotesen er riktig.
  • Sannsynlighet kan vi tolke som antall utvalg av alle utvalg i fordelingen, dette betyr at vi definerer sannsynlighet som en relativ frekvens.
  • Dette er ikke den eneste måten å definere sannsynlighet på, men den er helt sentral i frekventistisk statistikk

Utvalgsfordelinger

Statistisk styrke

Statistisk styrke

Nullhypotesen er… Sann Falsk
Forkasted Type-1 feil Riktig avgjørelse
Ikke forkasted Riktig avgjørelse Type-2 feil

Statistisk styrke

  • Vi kan beregne statistisk styrke, sannsynligheten for å forkaste nullhypotesen når den er falsk, ved å spesifisere en alternativ hypotese
  • Denne hypotesen sier noe om hvilken effekt vi ønsker å oppdage hvis den faktisk er sann

\[d = \frac{H_a}{SD} = \frac{10}{20} = 0.5\].

Statistisk styrke

Effektstørrelse 0.5
Risiko for type 1 feil (\(\alpha\)) 5%
Risiko for type 2 feil (\(\beta\)) 20%
Statistisk styrke (\(1-\beta\)) 0.8

Statistisk styrke

Styrke, effektstørrelser og p-verdier

Mer om p-verdier

Når nullhypotesen er riktig

P-verdier og konfidensintervaller